python 统计词频后输出结果到Excel和txt文档 |
您所在的位置:网站首页 › jupyter 输出表格 › python 统计词频后输出结果到Excel和txt文档 |
分词的应用场景还是蛮多的,比如电商里面的产品用户评价,每个商品的评价数很多,由于是大量的文本,需要从这些文本找出评价的关键字,这个时候分词就能派上用场;再比如,做文本分析,热点词统计都会用到分词。 整体思路就是利用python中的jieba库,对每一行文字进行分词处理,处理之后的结果放在list(列表)中。遍历列表,重复的值就计数,留下唯一的值作为key。 引用库 import jieba #分词 import xlwt #Excel库 import pandas as pd #pandas库 import matplotlib as mpl #matplotlib库由各种可视化类构成 from wordcloud import WordCloud #词云 import matplotlib.pyplot as plt #matplotlib.pyplot是绘制各类可视化图形的命令字库,相当于快捷方式 配置 mpl.rcParams["font.sans-serif"] = ['Microsoft YaHei']#配置字体 plt.rcParams["axes.labelsize"] = 16 #轴域大小 plt.rcParams["xtick.labelsize"] =14 #x轴字体大小 plt.rcParams["ytick.labelsize"] =14 #y轴字体大小 plt.rcParams["legend.fontsize"]=12 #图例字体大小 plt.rcParams["figure.figsize"]=[15,9] #图形大小如果不清楚figure、axes、xtick等概念,可以看下图 结果 客户 1238 拜访 1055 走访 1048 市场 687 服务 558 产品 500 技术 483 展会 405 写入Excel wbk = xlwt.Workbook() #定义一个workbook对象 sheet = wbk.add_sheet("wordCount")#新建一个sheet并命名 for i in range(len(key_list)): sheet.write(i, 1, label = orderList[i]) sheet.write(i, 0, label = key_list[i]) wbk.save(r'/Users/song/Downloads/wordCount.xls’)结果 结果类似下图,我隐去了真实案例生成的词云图 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |